Файл:RLHF diagram.svg

Файл
История файла
Использование файла
Метаданные

Размер этого PNG-превью для исходного SVG-файла: 512 × 366 пкс. Другие разрешения: 320 × 229 пкс | 640 × 458 пкс | 1024 × 732 пкс | 1280 × 915 пкс | 2560 × 1830 пкс.

Исходный файл ‎(SVG-файл, номинально 512 × 366 пкс, размер файла: 177 Кб)

Этот файл из на Викискладе и может использоваться в других проектах. Информация с его страницы описания приведена ниже.

Краткое описание

ОписаниеRLHF diagram.svg	English: This is a high-level overview of reinforcement learning from human feedback, including training an initial supervised model, collecting human feedback, training a reward model, and using it to align the initial model.
Дата	14 марта 2024
Источник	Собственная работа
Автор	PopoDameron

Лицензирование

Я, владелец авторских прав на это произведение, добровольно публикую его на условиях следующей лицензии:

Этот файл доступен по лицензии Creative Commons Attribution-Share Alike 4.0 International

Вы можете свободно:

делиться произведением – копировать, распространять и передавать данное произведение
создавать производные – переделывать данное произведение

При соблюдении следующих условий:

атрибуция – Вы должны указать авторство, предоставить ссылку на лицензию и указать, внёс ли автор какие-либо изменения. Это можно сделать любым разумным способом, но не создавая впечатление, что лицензиат поддерживает вас или использование вами данного произведения.
распространение на тех же условиях – Если вы изменяете, преобразуете или создаёте иное произведение на основе данного, то обязаны использовать лицензию исходного произведения или лицензию, совместимую с исходной.

История файла

Нажмите на дату/время, чтобы увидеть версию файла от того времени.

	Дата/время	Миниатюра	Размеры	Участник	Примечание
текущий	21:20, 1 апреля 2024		512 × 366 (177 Кб)	wikimediacommons>PopoDameron	Clarified relationship between RM and aligned model & added description to the aligned model

Использование файла

Следующая страница использует этот файл:

Обучение с подкреплением на основе отзывов людей

Метаданные

Файл содержит дополнительные данные, обычно добавляемые цифровыми камерами или сканерами. Если файл после создания редактировался, то некоторые параметры могут не соответствовать текущему изображению.

Ширина	100%
Высота	100%

Файл:RLHF diagram.svg

Краткое описание

Лицензирование

Краткие подписи

Элементы, изображённые на этом файле

изображённый объект

Обучение с подкреплением на основе отзывов людей

создатель

У этого свойства есть некоторое значение без элемента в

правовой статус

защищено авторским правом

лицензия

Creative Commons «Атрибуция — На тех же условиях» 4.0 Всемирная

дата основания, создания, возникновения

14 марта 2024

MIME-тип

image/svg+xml

источник файла

оригинальная работа загрузившего файл

История файла

Использование файла

Метаданные